Diese KI bringt Videos auf ein ganz neues Level – und das Ergebnis ist ziemlich unheimlich
«Sora» klingt harmlos, ist aber der aktuell fortschrittlichste Video-Generator. Er kann aus simplen Textanweisungen nahezu fotorealistische Videos von Menschen, Tieren oder Landschaften mit komplexen Kamerabewegungen erstellen.
Das sieht beispielsweise so aus:
OpenAI enthüllt Sora: ein Meilenstein in der KI-generierten Videotechnologie
Die veröffentlichten Beispielvideos wurden den Angaben zufolge komplett von künstlicher Intelligenz erstellt. Im oben stehenden Video mit der Frau lautete die Textanweisung demnach, sie solle eine Lederjacke und ein rotes Kleid tragen und selbstbewusst eine Strasse in Tokio entlanggehen. Die Strasse sei nass und reflektierend, was einen Spiegeleffekt der bunten Neonlichter erzeuge.
Entwickelt wurde das KI-Modell hinter Sora von OpenAI, dem von Microsoft mitfinanzierten Tech-Unternehmen, das den Chatbot ChatGPT und den KI-Bildgenerator DALL-E entwickelt hat. Letzteres ist ein Computerprogramm, das Bilder aus Textbeschreibungen aufgrund von maschinellem Lernen erstellt. Nun geht OpenAI mit KI-generierten Videos einen Schritt weiter.
Per Textbefehl erhält die KI Angaben zum Inhalt des Videos, und Sora liefert im Nu Kurzfilmchen von bis zu einer Minute Länge.
This video was made with the not-yet-released Sora AI technology just announced from OpenAi. This changes everything. It's 27 seconds from a text prompt.
— Ben Nash (@bennash) February 15, 2024
Here is their prompt:
Prompt: A white and orange tabby cat is seen happily darting through a dense garden, as if chasing… pic.twitter.com/8XxxFqiywC
Faszinierend und brandgefährlich
Sora kann auch bestehende Videos verändern oder aus Bildern kurze Clips generieren. All das ist nicht neu, aber auf einem zuvor nie gesehenen Niveau. Die meisten Menschen reagieren daher mit einer Mischung aus Faszination und Angst. Dies völlig zurecht. OpenAIs neuster Wurf ist beeindruckend, das Potenzial im Positiven wie negativen Sinn gewaltig.
Von Kritikern häufig geäusserte Befürchtungen sind vereinfachte Wahlmanipulation durch Deepfakes von Politikern, KI-generierte Rachepornos auf Knopfdruck und eine Flut an Urheberrechtsverletzungen. Kurz: Sora ist brandgefährlich. Denn die Geschichte lehrt uns, dass jede Technologie für Schlechtes missbraucht werden kann und wird.
OpenAI ist sich der Gefahren bewusst. Wasserzeichen sollen KI-Videos kenntlich machen. Rachepornos will das Unternehmen verhindern, indem Sora keine Aufforderungen akzeptiere, die extreme Gewalt, sexuelle Inhalte oder Ähnlichkeit zu echten Personen einfordern. Zudem erhält die Öffentlichkeit, abgesehen von handverlesenen Personen, bislang keinen Zugang. Expertinnen und Experten sollen zunächst mögliche Sicherheitsrisiken ausloten, bevor das Programm veröffentlicht wird.
Es ist also nur eine Frage der Zeit, bis Sora freigegeben wird. In absehbarer Zeit will OpenAI damit Geld verdienen. Auch dies ein verständliches Ansinnen, schliesslich dürften die allermeisten Kunden den KI-Generator redlich nutzen.
Um die Fähigkeiten von Sora zu vermitteln, hat OpenAI Dutzende Beispielvideos veröffentlicht. Ein Überblick.
Sora erstellt einen Film-Trailer
Browsing Sora's AI model examples is mindblowing. The speed this is coming is crazy...
— PedroPCMR (@PedroPCMR) February 16, 2024
"A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors." pic.twitter.com/4euRvqGoKm
Die Qualität der KI-Videos bringt auch bekannte YouTuber ins Grübeln. Als Reaktion schrieb etwa MrBeast, der erfolgreichste YouTuber der Welt, der für aufwendige Videos bekannt ist, an OpenAI-CEO Sam Altman gerichtet: «Sam, mach mich bitte nicht obdachlos.» Altman antworte: «Kann dir ein Video erstellen, was möchtest du?»
YouTuber MrBeast macht sich langsam Sorgen um seinen Job
will generate you a video, what would you like?
— Sam Altman (@sama) February 15, 2024
OpenAI-Chef Sam Altman erfüllt Video-Wünsche
— Sam Altman (@sama) February 15, 2024
Sora wird mit diesen 60-Sekunden-Clips in den nächsten Monaten nicht die Filmbranche umkrempeln, aber Video-Plattformen wie YouTube und TikTok könnten sich gehörig verändern. Die KI dürfte es sehr vielen Menschen ermöglichen, hochwertig aussehende Inhalte für soziale Plattformen zu produzieren.
Technische Massnahmen sollen dabei verhindern, dass User zum Beispiel historisch anmutende KI-Videos als echte Aufnahmen inszenieren. Menschen mit genug krimineller Energie finden jedoch erfahrungsgemäss fast immer einen Weg, solche Barrieren auszutricksen.
Ameisen mit vier statt sechs Beinen? Die KI hat noch so ihre Problemchen.
"pov footage of an ant navigating the inside of an ant nest"
— Aditya Ramesh (@model_mechanic) February 18, 2024
Video generated by Sora pic.twitter.com/N3Ik9QBinU
Eine Krabbe mit Glühbirne? Warum nicht.
"nighttime footage of a hermit crab using an incandescent lightbulb as its shell"
— Aditya Ramesh (@model_mechanic) February 18, 2024
Video generated by Sora pic.twitter.com/YcsxCeE5W2
Sora macht auch Drohnenvideos Konkurrenz
"The camera lowers and widens to a grand panoramic view overlooking the beautiful ocean and the historical buildings along the a stunning coastal picturesque town perched on the cliffs..."
— Bill Peebles (@billpeeb) February 17, 2024
Video generated by Sora. pic.twitter.com/d35Zebo4vc
KI hat offenbar noch immer keine Ahnung, was Hände sind oder wie sie funktionieren!
"realistic video of people relaxing at beach, then a shark jumps out of the water halfway through and surprises everyone"
— Tim Brooks (@_tim_brooks) February 17, 2024
Video generated by Sora pic.twitter.com/WRVnrguCif
Was ist DAS?!
Trotzdem: Generative KI macht rasend schnelle Fortschritte, wie dieser Vergleich mit einem KI-Video von Anfang 2023 zeigt.
Will Smith eating spaghetti is only 12 months old.
— Victor Riparbelli (@vriparbelli) February 16, 2024
2024 will be the year of AI video, voice and 3D.
SORA / OpenAI kicking it off.
LFG 🫡 pic.twitter.com/oFVlLxKeJG
Sora ist nicht perfekt, lässt aber andere Text-zu-Video-Generatoren ziemlich alt aussehen
OpenAI just dropped the bomb on video generation.
— Dogan Ural (@doganuraldesign) February 16, 2024
But how do they compare to their closest rival?
OpenAI: Sora vs Runway: Gen2 pic.twitter.com/JYbnCqm6Dd
Die gleiche Anweisung mit Sora und der Konkurrenz Stable Video
Sora 和 Stable Video,文本到视频的比较。pic.twitter.com/mUiivTvnec
— Will (@FinanceYF5) February 18, 2024
Sora kann auch bestehende Videos verändern. Hier fährt ein Auto durch eine gebirgige Waldlandschaft
As you know, my explorations of the Gen AI space is ultimately all about creative control. You should be able to shape the generative matter using all your artistic sensibilities and your aesthetic sense.
— Martin Nebelong (@MartinNebelong) February 16, 2024
OpenAI's Sora is a huge technological leap, but what excites me the most… pic.twitter.com/NQGfLRiq75
Man kann Sora auffordern, das Original-Video beizubehalten, aber das Geschehen in den Winter zu verlegen
Prompt: keep the video the same but make it be winter. 🧵 pic.twitter.com/eAMwRlqx7N
— Martin Nebelong (@MartinNebelong) February 16, 2024
Das passiert, wenn man Sora sagt: «Verlege den Schauplatz in die 1920er-Jahre mit einem Oldtimer. Behalte die rote Farbe bei.»
Prompt: change the setting to the 1920s with an old school car. make sure to keep the red color. 🧵 pic.twitter.com/vfZWNZMUmp
— Martin Nebelong (@MartinNebelong) February 16, 2024
Oder: «Wandle das Video in einen Pixel-Art-Stil um.»
Prompt: rewrite the video in a pixel art style. 🧵 pic.twitter.com/HrP8aFMILp
— Martin Nebelong (@MartinNebelong) February 16, 2024
Zu guter Letzt kann Sora Bilder und Fotos zum Leben erwecken
SORA can animate images pretty amazingly.
— AP (@angrypenguinPNG) February 16, 2024
Prompt: "In an ornate, historical hall, a massive tidal wave peaks and begins to crash. Two surfers, seizing the moment, skillfully navigate the face of the wave." pic.twitter.com/rNDB98jTe2
Diese Videos und viele weitere auf der OpenAI-Webseite zeigen: Der Geist ist aus der Flasche. Und Sora ist nur die Speerspitze, weitere KI-Tools werden folgen. Es liegt an den Menschen, etwas Kreatives damit zu erschaffen.